Fusion Compiler

工具概述

定位与起源

定位与起源:Fusion Compiler(FC)是Synopsys的革命性产品——2018年发布——将RTL综合和物理设计融合为一个统一引擎。传统流程中综合(DC)和物理设计(ICC2)是分离的→中间需要网表格式转换→信息丢失→QoR损失。Fusion Compiler消除了这个gap——综合引擎直接操作物理数据——物理引擎直接操作逻辑结构。

Fusion Compiler是Synopsys"Fusion"战略的核心——不再有"综合→网表→PnR"的线性流程——而是"RTL→GDSII"的统一优化——在RTL阶段就预知物理效果——在物理阶段仍可调整逻辑结构。

核心技术

RTL-to-GDSII统一引擎:综合和物理设计共享单一数据模型和单一优化引擎。在placement时还可以restructure逻辑——在综合时已经预估了线延迟。消除了传统流程中"综合做完了才发现物理上不可行"的问题。

RTL Architect预测:在RTL编码阶段就可以跑RTL Architect——预测这个RTL在物理实现后的PPA——在编码阶段就发现物理问题——修复成本=零。

AI驱动的全流程优化:DSO.ai在Fusion Compiler中做全空间搜索——不仅搜索物理参数——还搜索逻辑结构(是否pipeline?分几级?数据路径多宽?)——这是传统工具无法做到的。

3DIC原生支持:Fusion Compiler原生支持3D堆叠设计——可以在不同die之间同时优化placement+clock tree+thermal。

主要功能

* 统一综合+物理设计:不需要DC+ICC2两个工具/license——Fusion Compiler一份license做全部。 * RTL-to-GDSII全流程:读入RTL→综合→Floorplan→Place→CTS→Route→ECO——统一环境。 * RTL Architect预测:在RTL阶段预测最终PPA——提前发现物理问题。 * 3DIC多die协同优化:多die同时做placement/CTS/routing——热密度管理——TSV位置优化。

实战案例

- 某5nm手机AP用FC统一流程:传统DC+ICC2→综合到物理WNS恶化30ps→ECO 3周。FC统一流程→WNS恶化<5ps→ECO 2天。 - RTL Architect发现RTL问题:某RTL在FC的RTL Architect预测中显示WNS=-80ps——因为数据路径太长(30级逻辑)。在RTL阶段加了pipeline→WNS=+20ps——还没综合就解决了。 - 3DIC用FC做thermal优化:某3D堆叠芯片上下die的PPA互相影响——FC同时优化两层die的placement——热密度均衡——峰值温度降15°C。

常见误区

误区一:FC=DC+ICC2拼起来。 FC是完全不同的架构——不是DC+ICC2的包装。FC的统一数据模型是两个产品无法实现的。

误区二:FC适合所有设计。 FC特别适合先进工艺(≤7nm)和大型设计(>10M instances)。对于成熟工艺(≥28nm)的小设计——独立的DC+ICC2可能更简单。

误区三:用了FC就不用管物理设计了。 FC虽然融合了——但物理设计的专业知识仍然需要——macro placement、电源网格、CTS策略——这些是工程师的决策——不是工具的。

版本演进

- 2018:Fusion Compiler发布:业界第一个RTL-to-GDSII统一平台。开创"Fusion"时代。 - 2019–2021:快速迭代:加入RTL Architect。加入DSO.ai全空间搜索。先进工艺全面支持。 - 2022:3DIC支持:原生支持多die设计。热感知的placement和优化。 - 2023–present:AI驱动:LLM辅助设计探索。自动生成优化策略。Fusion Compiler成为Synopsys旗舰产品。

相关论文

- RTLA / TestMax Advisor:布局布线原型 - RTLA 与 TestMax Advisor:P&R 原型验证中处理不完整 RTL 与 DFT 约束 - FPlab:一种参数化方法简化布图规划执行 - RTLA/TestMax Advisor:利用RTL分析处理脏数据加速P&R原型验证 - 数字设计方法论 - 数字设计方法论 - 数字设计方法论 - 标准单元库功能丰富度基准对比及其对设计PPA的影响 - 低功耗设计方法论 - 利用Intel 18A RibbonFET和PowerVia技术通过Fusion Compiler优化PPA收益 - 先进Fusion Compiler综合与布局布线技术驱动性能与周转时间提升 - 利用RTL Architect构建更优IP——Arteris NoC IP物理探索 - 多行设计方法论:同时使用高速与高密度单元库 - 先进节点综合支持 — Design Compiler Graphical - 使用IC Compiler II进行新兴节点设计 - 最新ARM处理器高性能高能效实现的最佳实践 - 7nm设计的性能、功耗和面积优化技巧 - 模块级时钟树改进方法 - PrimeTime 签核领导力 —— 5nm 节点使能与 QoR 最大化 - 利用 RedHawk Analysis Fusion 缓解先进节点的 PG 网络电压降问题 - RTL Architect如何提升效率以实现最优PPA - 高性能计算芯片组的物理设计方法学演进 - 玄铁RISC-V CPU的Synopsys设计流程与性能优化 - 大幅提升版图效率的定制设计自动化实施方案——可视化辅助版图自动化 - 利用设计空间优化加速达成目标:介绍DSO.ai - 炫铁RISC-V CPU IP参考流程:使用Fusion Compiler最大化每瓦性能 - Fusion + DSO.ai + DesignDash打造芯片数字孪生:AI助力RISC-V内核5nm大数据加速4nm设计 - Redhawk-SC Fusion驱动的IR感知布局 - Simply Better RTL -- RTL Architect 入门指南 - 安全规范格式(SSF)驱动加速汽车设计收敛 - 使用Synopsys RISC-V解决方案进行高效SoC开发 - 最大化PPA与生产力回报:释放Fusion Compiler的全部潜力 - 基于RedHawk-SC Fusion的驱动布局方法 - 释放完整功耗优化潜力:最大化PPA与效率回报 - 利用RTL Architect构建更优IP——Arteris NoC IP物理探索 - PrimePower -- 先进技术节点的晶圆厂合作与认证 - 设计中IR Drop优化与自动修复方案 - UR Scout:基于RTLA综合的布图规划质量增强工具 - 先进Fusion Compiler综合与布局布线技术推动性能和周转时间 - 释放Synopsys.ai的力量:使用DSO.ai为高性能ARM CPU实现PPA和生产力提升 - 多比特寄存器组优化技术 - 多位寄存器组:RLS设计中的挑战 - 全面的 CTS 与物理感知多位寄存器综合方法学 - 高速内核实现的布局布线流程定制化/SNUG_TPC_CCD_高速内核实现的布局布线流程定制化.md) - Cortex-A55低功耗实现最佳实践——使用PrimeTime优化 - Synopsys端到端低功耗解决方案 - 使用块抽象和时序提取模型进行复杂百万门级SOC的分层实现 - 实现复杂IP在SoC设计中的快速集成 - 使用块抽象模型和时序提取模型进行复杂数百万门SoC的层次化实现 - 加速复杂IP在SoC设计中的快速集成 - 2.1GHz ARM Cortex-A55功耗约束存储SoC的实现流程 - 2.1GHz ARM Cortex-A55 实现流程:面向功耗受限的存储 SoC - 使用 Fusion Compiler 实现 ARM 核处理器最优 PPA 的最佳实践 - 使用 Synopsys Galaxy 设计平台在 16FF+ 工艺中实现 ARM Cortex-A72 处理器的高性能节能实现 - 下一代RTL综合:未来十年的RTL综合